UTF-8UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码,属于Unicode标准的一部分,最初由肯·汤普逊和罗布·派克提出。由于较小值的编码点
UTF-1不是2的幂,所以转化得也相当缓慢。由于以上这些问题,UTF-1从来没有得到广泛採用,并已被UTF-8所取代。 UTF-1是一个类似于UTF-8的多字节编码;一个单一的Unicode代码点可以被编码成一个、两个、三个或五个八位字节。而如同UTF-8,ASCII码系列可被编码为一个八位字节,ASCII码的八位字节0X21
UTF-16本页面有特殊字符,操作系统及浏览器須支持特殊字母与符号才能正確显示,否则可能變成乱码、问号、空格等其它符号。 UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicod
UTF-7Authority)的字元集列表裏被引述為UTF-7,然而UTF-7本身並非Unicode的標準之一,即使在目前最新的Unicode 5.0裏也僅列出UTF-8、UTF-16和UTF-32。 如同引言所提到的,由於在過去SMTP的傳輸僅能接受7位元的字元,而當時Unicode並無法直接滿足既有的SMTP傳輸限制,在這樣地背景下UTF
UTF-32UTF-32是32位Unicode转换格式(Unicode Transformation Formats, 或UTF)的缩写。UTF-32是一种用于编码Unicode的协定,该协定使用32位比特对每个Unicode码位进行编码(但前导比特数必须为零,故仅能表示231个Unicode码位)。与其他可变